আমাদের খুব পরিচিত একটি এক্সপেরিমেন্ট নিয়ে ভাবা যাক। ধর আমরা একটি ছক্কা রোল করেছি এবং জানতে চাচ্ছি আসার সম্ভাবনা কত (ধরে নাও ছক্কায় যেকোনো সংখ্যা আসার সম্ভাবনা সমান)? উত্তর নিশ্চয়ই ; এখানে একটি ফেয়ার ছক্কা রোল করা হয়েছে বাদে এক্সপেরিমেন্ট সম্পর্কে কোনো অতিরিক্ত তথ্য ছিল না আমাদের কাছে। কিন্তু কেও যদি আমাদের বলে রোলটিতে একটি বিজোড় সংখ্যা এসেছে, তাহলে কিন্তু আসার সম্ভাবনা থেকে বেড়ে হয়ে যাবে। অর্থাৎ আমরা যখন এক্সপেরিমেন্ট সম্পর্কে অতিরিক্ত তথ্য পাই তখন কোনো ইভেন্ট ঘটার সম্ভাবনাও পরিবর্তিত হয়ে যায়। যেমন “বাংলাদেশের ভারতকে ক্রিকেট ম্যাচে হারানোর সম্ভাবনা” আর “বাংলাদেশের ভারতকে ক্রিকেট ম্যাচে হারানোর সম্ভাবনা যখন ম্যাচ মিরপুরে হবে” একই কথা নয়- ভেন্যু সম্পর্কে এই অতিরিক্ত তথ্য আমাদের ম্যাচ জিতার সম্ভাবনা বাড়িয়ে দিচ্ছে!
যদি দুটো ইভেন্ট এবং হয়, তবে " ঘটলে ঘটার সম্ভাবনা" অর্থাৎ "Probability of given " কে দ্বারা প্রকাশ করা হয়। যেমন আগের উদাহরণে ছক্কায় আসা ও ছক্কায় বিজোড় সংখ্যা আসা ধরলে কিন্তু । তবে বের করার কি সহজ কোনো উপায় আছে?
লক্ষ্য কর, এবং উভয়ই ঘটার সম্ভাবনা, অর্থাৎ , হচ্ছে ঘটার সম্ভাবনা, অর্থাৎ , এবং ঘটলে ঘটার সম্ভাবনা, অর্থাৎ , এর গুণফল: । কাজেই,
এটি অন্যভাবেও ভাবতে পারো, মনে কর sample space একটি ক্ষেত্রফল বিশিষ্ট একটি চতুর্ভুজ। তাহলে আর হচ্ছে যথাক্রমে আর বৃত্তটির ক্ষেত্রফল।

শুরুতে মনে হতে পারে আমরা জানি এক সন্তান ছেলে, তাহলে অপর সন্তানও যেহেতু ছেলে বা মেয়ে হতে পারে, আর উভয় ক্ষেত্রেই সম্ভাবনা সমান, তাই অপর সন্তান ছেলে হওয়ার সম্ভাবনাও , কিন্তু তা সত্য নয়। দুটো ইভেন্ট ডিফাইন করা যাক-
আমাদের দরকার । লক্ষ্য কর , (কারণ ঘটবে না শুধু যখন উভয় সন্তান ই মেয়ে হবে, যার সম্ভাবনা ), আর (কারণ ঘটলে সবসময় সত্য)। কাজেই ।
এটি আসলে আমরা এত কিছু না করে sample space এর দিকে তাকালেই পারতাম। লক্ষ্য কর, একজন সন্তান ছেলে হয়ে গেলে আমাদের sample space থেকে উভয় সন্তান মেয়ে ইভেন্টটি বাদ পরে যাচ্ছে, ফলে তা দ্বারাচ্ছে । ফলে ঘটার সম্ভাবনা থাকছে ।
সমস্যাটা দেখেই মনে হতে পারে এর সাথে আগের সমস্যার কোনো পার্থক্য নেই, তাহলে নিশ্চয়ই উত্তর ও আগের মত , কেনোনা সন্তান সপ্তাহের কোন দিন জন্মেছে তাতে কিছু যায় আসার কথা না। কিন্তু তা সত্য নয়, মজার ব্যাপার হচ্ছে এবার উত্তর থেকে অনেক বেশি! আবার আগের মতো ইভেন্ট ডিফাইন করা যাক-
সবার আগে লক্ষ্য করতে পারো এবার কিন্তু আগের মতো এর মান নয়, কেনোনা উভয় সন্তান ছেলে হলেও এর মধ্যে একজনের জন্ম শুক্রবারে তা নিশ্চিত করা যায় না। আমরা প্রতি সন্তানকে সে ছেলে নাকি মেয়ে আর সে সপ্তাহের কোন দিন জন্মেছে তার ভিত্তিতে একটি পেয়ার হিসেবে প্রকাশ করতে পারি। এরকম পেয়ার থাকতে পারে টি। কাজেই এবার sample space এর সাইজ । আবার উভয় সন্তান ছেলে হলে তারা সপ্তাহের কোন দিন জন্মেছে তা নির্বাচন করার উপায় থাকে টা, কাজেই । বের করতে আমরা এর কমপ্লিমেন্ট, অর্থাৎ বের করে থেকে বিয়োগ করে দিতে পারি; মানে হচ্ছে দুই ছেলের কেওই শুক্রবারে জন্মায় নি, তাহলে আমাদের হাতে দিন বাকি থাকল টি, কাজেই , কাজেই । একই ভাবে থেকে বের করা সহজ: যেহেতু মানে কোনো ছেলে সন্তান শুক্রবারে জন্মাতে পারবে না, তাই সন্তান ছেলে নাকি মেয়ে আর সপ্তাহের কোন দিন জন্মালো এই পেয়ার নির্বাচন করার উপায় থাকলো টি, কাজেই । সুতরাং . কাজেই , যা এর খুব কাছাকাছি!
তুমি হয়তো ভাববে যেহেতু নির্বাচন করা বক্সটিতে একটি গোল্ড কয়েন আমরা পেয়ে গেছি, তাহলে দুটো সিলভার কয়েনের বক্সটি আমরা চিন্তা থেকে বাদ দিয়ে দিতে পারি, কাজেই দুটো বক্স আছে এবং এর মধ্যে দুটো গোল্ড কয়েনসহ বক্স একটি, তাই উত্তর হবে । কিন্তু সেটি ঠিক নয়।
সুবিধার জন্য আমরা দুটো গোল্ডের বক্সকে , দুটো সিলভার কয়েনের বক্সকে এবং একটি গোল্ড আর একটি সিলভার কয়েনের বক্সকে দিয়ে প্রকাশ করি। আর শুরুতে একটি গোল্ড কয়েন আর সিলভার কয়েন পিক করার ইভেন্টকে যথাক্রমে আর ধরি।
আমরা জানতে চাই এর মান। লক্ষ্য কর এবং , কেনোনা গোল্ড কয়েনের বক্স নির্বাচন করলে সবসময়ই আমরা গোল্ড কয়েন পাবো। বের করতে আমরা টা কেসে ভাগ করতে পারি: শুরুতে নির্বাচন করলে (যার সম্ভাবনা ) সবসময় একটি গোল্ড কয়েন পাবো (অর্থাৎ সম্ভাবনা ), আর নির্বাচন করলে (যার সম্ভাবনা ) গোল্ড কয়েন পাওয়ার সম্ভাবনা , আর নির্বাচন করলে (যার সম্ভাবনা ) গোল্ড কয়েন পাওয়ার সম্ভাবনা , কাজেই । কাজেই,
কাজেই তোমার নির্বাচন করা বক্সে দুটো কয়েনই গোল্ড হওয়ার সম্ভাবনা । এটি এভাবেও ভাবতে পারো- একটি কয়েন গোল্ড পাওয়া মানে সেটি দুটো গোল্ড কয়েনের বক্সের যেকোনো একটি হতে পারে (এখানে ২টি অপশন), কিংবা একটি সিলভার ও একটি গোল্ড কয়েনের বক্সের গোল্ড কয়েনটি হতে পারে (এখানে ১টি অপশন)। আর যেহেতু শুরুতে এর যেকোনো একটি কয়েন নির্বাচন করার সম্ভাবনা সমান, আর এই তিন ক্ষেত্রের দুই ক্ষেত্রেই আমরা দুটো গোল্ড কয়েনের বক্স নির্বাচন করছি, তাই এর সম্ভাবনা ।
এটি Conditional Probability এর আমার খুব পছন্দের সমস্যা। সমস্যাটা দেখে শুরুতেই intuition বলে যেহেতু টেস্টটি accurate, তাহলে নিশ্চয়ই তোমার রোগটি সত্যিই হওয়ার সম্ভাবনা (after all, false positive রেট মাত্র !)। কিন্তু সেটা সত্য নয়! শুরুতে কিছু event ডিফাইন করা যাক-
যদি আমাদের কাছে কোনো prior ইনফর্মেশন (এক্ষেত্রে টেস্ট রিপোর্ট) না থাকে, তাহলে তোমার রোগ হওয়ার সম্ভাবনা কত? যেহেতু রোগটি গড়ে জনে একজনের হচ্ছে, তাই বলতে পারি prior ইনফর্মেশন ছাড়া । টেস্ট রিপোর্টের accuracy (উপরে যেভাবে ডিফাইন করা হয়েছে তা অনুযায়ী) থেকে আমরা কী বুঝছি? এটি বলছে “তোমার রোগটি হয়ে থাকলে টেস্টে ধরা পড়ার সম্ভাবনা”, অর্থাৎ “Probability of being tested positive given that you are sick”, কিংবা "Probability of given " বা ; কাজেই । আর আমরা জানতে চাচ্ছি “Probability of being sick given that the test reports you are sick”, অর্থাৎ - সেটি কিন্তু নয়!
এবার আমরা যদি এর মান জানি তাহলেই Bayes’ Theorem কাজে লাগিয়ে এর মান বের করে ফেলতে পারবো! টেস্ট রিপোর্ট পজিটিভ আসার সম্ভাবনা কে আমরা আসলে দুটি আলাদা কেসে ভাগ করতে পারি-
কাজেই আমরা পাচ্ছি, । এবার আমরা বের করতে পারবো!
তারমানে টেস্টে পজিটিভ আসার পর ও রোগ না হওয়ার সম্ভাবনা প্রায় ! টেস্টটি এতোটা নিখুঁত হওয়া সত্ত্বেও তোমার রোগটি হওয়ার সম্ভাবনা আসলে খুবই কম! বিষয়টি মেনে নিতে কষ্ট হলে জনের একটি sample নিয়ে ভাবতে পার। গড়ে প্রতি হাজারে যেহেতু একজনের রোগটি হচ্ছে, তাই এখানে রোগ হবে জনের। কিন্তু যেহেতু টেস্টটি নিখুঁত, তাই এতে জনের টেস্ট পজিটিভ আসবে, আর জনের টেস্ট false নেগেটিভ আসবে। আবার যেহেতু টেস্টের false positive রেট , তাই বাকি জন মানুষ false positive পাবে! কাজেই টেস্টে পজিটিভ রিপোর্ট পাওয়া মোট মানুষের সংখ্যা দ্বারাচ্ছে জন, আর এর মধ্যে রোগাক্রান্ত মাত্র জন! কাজেই তোমার রোগ হওয়ার সম্ভাবনা মাত্র , যা অনেক কম!
তুমি নিশ্চয়ই ভাবছো যেহেতু হোস্ট একটি দরজা খুলে দিয়েছে যার পিছনে ছাগল ছিল, তাহলে বাকি দুটো দরজার একটির পিছনে গাড়ি আর অন্যটির পিছনে ছাগল থাকায় তুমি প্রথমে যেই দরজা নির্বাচন করেছো তার পিছনে গাড়ি থাকার সম্ভাবনা এবং অন্যটির পিছনেও গাড়ি থাকার সম্ভাবনা , কাজেই শুরুতে যেটি নির্বাচন করেছো সেটিতে থাকা কিংবা দরজা পরিবর্তন করা উভয় ক্ষেত্রেই জিতার সম্ভাবনা সমান হওয়া উচিত। কিন্তু সেটা সত্য নয়, তুমি সুইচ করে যদি অন্য দরজাটি নির্বাচন কর তাহলে তোমার গাড়ি জিতার সম্ভাবনা দ্বিগুণ হয়ে যাবে!
তুমি শুরুতে যেই দরজাটি নির্বাচন করেছো সেটির পিছনে গাড়ি থাকার সম্ভাবনা , এবং বাকি দুটো দরজার যেকোনো একটির পিছনে গাড়ি থাকার সম্ভাবনা । এখন লক্ষ্য কর, হোস্ট কিন্তু আগে থেকে জানে কোন দরজার পিছনে কি আছে, তাই সে ইচ্ছা করেই এমন দরজা খুলবে যার পিছনে ছাগল আছে। তুমি যদি প্রথমে ভুল দরজা নির্বাচন করে থাক (যার সম্ভাবনা ), আর বাকি দুটো দরজাকে আর দিয়ে মার্ক করলে, হোস্ট কিন্তু দরজা খুলবে যদি এর পিছনে গাড়ি থাকে, আর দরজা খুলবে যদি এর পিছনে গাড়ি থাকে। কাজেই তুমি যদি সুইচ না করে শুরুর দরজাই নির্বাচন কর, তাহলে তুমি তখন ই জিতবে যখন তুমি শুরুতেই সঠিক ভাবে বের করতে পারবে কোন দরজার পিছনে গাড়ি রয়েছে, যার সম্ভাবনা , আর তুমি যদি শুরুতে ভুল দরজা নির্বাচন করে থাক, যার সম্ভাবনা , সেসকল ক্ষেত্রে কিন্তু সুইচ করলে তুমি জিতে যাচ্ছ! কাজেই যেহেতু শুরুতে ভুল করার সম্ভাবনা বেশি, তাই সুইচ করলেই তোমার জিতার সম্ভাবনা বেশি ( থেকে বেড়ে )!
এখনো মেনে নিতে কষ্ট হলে ধরে নাও তোমার সামনে তিনটার বদলে টি দরজা আছে, আর টার পিছনে ছাগল এবং একটির পিছনে গাড়ি আছে। তুমি একটি দরজা নির্বাচন করবে, আর হোস্ট বাকি টি থেকে টি দরজা খুলে দেখাবে যার পিছনে ছাগল আছে। এবার ফিল করা সহজ যে সবসময় আমাদের সুইচ করা উচিত। কেনোনা টি দরজা থেকে শুরুতে ঠিকঠাক যে দরজার পিছনে গাড়ি আছে তা খুঁজে বের করার সম্ভাবনা অনেক কম, মাত্র , অন্যদিকে বাকি টির মধ্যে একটিতে গাড়ি থাকার সম্ভাবনা অনেক বেশি ()। হোস্ট যখন সেই টার মধ্যের কোন টি দরজার পিছনে ছাগল আছে তা বলে দিচ্ছে, এতে করে তোমার শুরুতে সঠিকভাবে নির্বাচন করার সম্ভাবনা বেড়ে যাচ্ছে না, বরং বাকি যেই টা দরজা ছিল তার মধ্যে একটিতে গাড়ি থাকার সম্ভাবনার পুরোটাই একটি দরজার মধ্যে পুঞ্জিভূত তা বুঝা যাচ্ছে!